大模型收敛后,囤积的GPU算力还能租出去吗?
进入2023年11月,算力租赁迎来一轮涨价潮。
“千模竞赛”下,算力需求旺盛,算力租赁似乎成为“风口上的猪”,相关企业均能够凭借此获得丰厚的收益,数据中心也迎来新的转型发展时机,但事实真是如此吗?
算力租赁是好机会
得益于大模型的爆发,算力需求快速增长,据预测,到2024年年底我国将有5%—8%的企业大模型参数从千亿级跃升至万亿级,算力需求增速会达到320%。
倍数级的增长意味着巨大的市场,而与自建算力比起来,租赁外部算力更灵活,也更合算,这让算力租赁适时而起,成为相关企业新的发展机遇,甚至多家企业跨界进入,包括莲花健康、ST瑞德、平治信息等。
第十八届中国IDC产业年度大典(IDCC2023)上,超聚变数字技术有限公司算力基础设施领域CTO丁煜表示,AI是一个新的应用范式,有机会打破过去云计算厂商或其他传统商业软件厂商构建出来的相对已固化的市场。算力租赁是一个新赛道,有可能产生新的优胜者。目前众多投资人进入这一领域也证明了这是一个好的机遇。
图:超聚变数字技术有限公司算力基础设施领域CTO丁煜
丁煜还明确了算力租赁的需求对象,他指出,今天谈及算力租赁的时候,聊的不是已经成为巨头的公司,巨头公司已经有自用算力,我们应清醒的意识到给独立的AI开发人才是市场需求者。
同时,对于中立厂商而言,当前机遇更为契合。摩尔线程云计算副总裁王华指出,目前看算力市场缺口比较大,但国内大厂的算力已经很难租到,中立一些的上升业务较少的厂商做算力租赁机会更大,从安全角度也更为合适。
图:摩尔线程云计算副总裁王华
算力租赁需要面对多重挑战
算力租赁的巨大市场毋庸置疑,对于数据中心而言是实现突破的重大契机,但机遇之下往往也伴随危机,这主要表现在我国算力租赁市场需求虽然快速增长,但供需不平衡,算力租赁在供给方面,存在着多个挑战。
始智AI联合创始人CTO黄新平表示,当前处于基础训练的阶段,还是大量堆显卡、算力的时期,严重依赖于原有云计算的能力,数据中心想要建立算力租赁的能力,需要从头建设,目前来看难度极大。
图:始智AI联合创始人CTO黄新平
具体来看:一,技术问题。数据中心提供算力,并非简单的买设备、通电就能实现。丁煜指出,智能算力市场发展极快,投资与研发周期缩短,技术与产品的更新要求增加,以此将算力迅速地释放出来,这给芯片、设备厂商带来巨大的压力,需要加快技术的革新速度,提升技术转化能力。
UCloud优刻得混合云业务中心总经理唐立则从更为细致的方向指出,数据中心里网络搭建、性能优化、后续维护、局部调优等都是算力租赁过程中涉及到的技术,需要进一步的发展创新。
图:UCloud优刻得混合云业务中心总经理唐立
二,生态问题。算力租赁涉及多条产业,芯片厂商、云厂商、设备厂商、IDC厂商、大模型厂商等形成良好的产业合作是充分发挥各自优势,推动算力租赁的重要基础。丁煜指出,理想状态下,算力租赁租的是FLOPS,不是任何一家厂商的产品,这需要多产业进行生态融合,也是未来把算力租赁生意做好的关键。
不过,目前我国在此方面依旧处于相对早期阶段。在芯片方面还面临“卡脖子”问题。王华指出,由于国内卡的算力比英伟达要低,因此,目前大模型的基本训练是千卡起。国内芯片厂商已经在全力推动,但能将千卡训练做到商业级别的还是少数。想要如英伟达等形成完善的生态,国内的生态建设要重头逐步做起,需要政府的支持、行业的共同推动,是比较漫长的过程。
三,安全问题。数据安全的重要性已经不言而喻,在算力租赁的过程中同样如此。王华表示,目前安全问题有两个解决方案,一是技术手段,将数据从传输到运算全过程进行加密,但成本也会增加;二是政府牵头规范,通过政策来进行推动,需要多方协同,不断完善。
同时,就企业而言,中立的算力提供商在安全方面有着天然优势,有望在算力租赁中实现更大发展。
四,成本问题。技术方面相对欠缺、高端芯片的短缺、生态建设的不足、安全防护的提升,这些都导致算力租赁成本的升高。唐立以高端芯片为例指出,当涉及A800或H800算力的租赁,如果进入较早,芯片购买成本较低,能够从中获得较好收益;如果进入较晚,芯片成本较高,可能两三年都不一定能够回本。而未来算力租赁市场价格无法准确预测,高成本下将带来较高的风险。
除此之外,伴随着入局者增多,算力租赁市场竞争也越发激烈。对于数据中心而言,这同样增加了获益难度。
因此,数据中心想要抓住算力租赁的机遇,需要在技术、生态、安全等问题上实现突破,需要高端芯片的基础,需要政府的指引、支持,需要与多产业的深度融合,以降低成本。由此,算力租赁才能实现算力的有效供给。
由此可见,当前算力租赁市场固然广大,但这门生意并不好做,需要在高端芯片、优良设备的基础上进行,且面临多方面的革新、优化。
大模型收敛之时,算力租赁将迎边缘需求爆发
判断算力租赁是否是一门好生意,除了看其当下的机遇与挑战,还要从长远来分析,其是否能够形成长久的良性的市场供需,尤其是在大模型发展逐步发展成熟,千模竞赛结束之时,算力租赁未来市场是否依旧有大量需求释出是关键。
竹间智能COO孙彬指出,大语言模型的核心点较为一致,竞争结果很可能是赢者通吃,巨头产生后,可能拥有自身的算力资源,算力租赁存在着不确定性。不过,训练模型大家趋同后,应用开发百花齐放时,推理变为了新的需求。
图:竹间智能COO孙彬
丁煜进一步指出,大模型的收敛是必然趋势,但收敛后并非绝望的开始。训练的算力固然可能会集中到有自建数据中心的企业中,不过,应用环节的到来却释放出了海量的算力租赁需求。应用将在成熟的大模型基础上实现创新,大量端侧产品需要算力支撑,边缘算力将爆发,成为算力租赁的主要需求方。
伴随应用的增多,算力租赁新的爆发时刻也将到来。算力的供给也会发生新的变化,大规模集中式的数据中心或许更多的是自建,适应不同行业或者地区的边缘算力将迎来发展。
同时,算力还将逐步实现标准化,黄新平表示,在政策的推动下,应用与开发环境更友好,国产芯片得到升级,国产算力迎来新发展,将从技术层面抹平异构算力的区别,以实现更好的供给。
综合来看,大模型的发展,不论是推理还是应用阶段,对算力租赁都将有着巨大的需求,不过,在算力供给方面存在着技术、安全、生态、成本等挑战,同时,推理与应用的算力需求点却有所不同,应用将向边缘算力转移,数据中心想要抓住机遇需要不断解决相应问题,并面向未来边缘侧需求进行优化。孙彬指出,大模型、人工智能呈爆发趋势,大规模的训练需求之后,一定有起伏的曲线,会再次回归增长,而增长的黄金点便是在应用百花齐放的时间段,这也将是整个IDC产业迎来第二次爆发的时期,从芯片到设备到云计算等产业上下游企业将实现共赢。
| 文章来源:中国IDC圈
算力进化 数字开物——第十八届中国IDC产业年度大典盛大召开
算力引领,高质量赋能 | 2023算力产业高质量发展全国大会在京召开
腾讯科技Hi Tech Day 暨 2023 数字开物大会隆重召开